Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de las peores situaciones que nos ha tocado vivir en México y en el mundo en los últimos años. Si bien, podemos obtener información acerca de la situación de esta pandemia en nuestro país en las conferencias emitidas diariamente, siempre quedan preguntas o nos surge algún interés en particular. Para esto, la Secretaría de Salud en su página de COVID publica los datos abiertos que utilizan para realizar algunos de los los análisis que muestran diario. El tener disponibles estos datos nos permite explorar más allá de lo que nos muestran, resolver nuestros propios intereses y tratar de estar mejor informados y cuestionarnos acerca de lo que los medios informan.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para poder compartirlo con ustedes, presentando distintas visualizaciones que nos ayuden a entender como ha ido evolucionando la pandemia en el pais y mantenernos informados en algo que es de interés público. Al mismo tiempo, si tienen alguna duda, interés en explorar algo o comentarios acerca del análisis, me pueden dejar sus comentarios en nuestra página de Facebook "Análisis y visualización de datos". El análisis lo estoy actualizando periódicamente.

Cabe aclarar que en esta exploración de los datos de COVID19 no muestro modelos ni predicciones ya que no estoy especializado en cuestiones epidemiológicas.

En una vista rápida de los datos, con un formato más completo, podemos ver la siguente información:

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-09-01 0b79a6 2 ESTATAL 15 MUJER CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-07-01 ... SI NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TOLUCA
1 2020-09-01 1b0c85 2 IMSS 5 MUJER SAN LUIS POTOSI COAHUILA DE ZARAGOZA AMBULATORIA 2020-04-03 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA SALTILLO
2 2020-09-01 17ae86 2 IMSS 2 MUJER VERACRUZ DE IGNACIO DE LA LLAVE BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... SI NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TECATE
3 2020-09-01 14df1c 2 IMSS 31 HOMBRE YUCATAN YUCATAN AMBULATORIA 2020-04-23 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA UMÁN
4 2020-09-01 0f3272 2 IMSS 1 HOMBRE AGUASCALIENTES AGUASCALIENTES AMBULATORIA 2020-04-26 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA JESÚS MARÍA

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento (confirmados, negativos y pendientes).

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(1360123, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar, debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 606036
Número de personas con resultado negativo a COVID-19: 676958
Número de personas que esperan un resultado de la prueba de COVID-19: 77129
Número de fallecimientos con COVID-19 positivo: 65241
Número de sujetos analizados hasta el momento: 1360123

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19, pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
5435 2020-09-01 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
13131 2020-09-01 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
22020 2020-09-01 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
24327 2020-09-01 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
36458 2020-09-01 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
108471 2020-09-01 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
110129 2020-09-01 12a243 2 SSA 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-24 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALPAN
119926 2020-09-01 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
137013 2020-09-01 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
137051 2020-09-01 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
144314 2020-09-01 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
182296 2020-09-01 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
207027 2020-09-01 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
625692 2020-09-01 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA
627157 2020-09-01 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
629268 2020-09-01 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
630841 2020-09-01 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES
633255 2020-09-01 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA

18 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columna ENTIDAD_RES contiene la entidad en donde se encontraba el sujeto al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 99564
1 MEXICO 68516
2 GUANAJUATO 31998
3 NUEVO LEON 29524
4 VERACRUZ DE IGNACIO DE LA LLAVE 28581
5 TABASCO 28471
6 PUEBLA 27070
7 TAMAULIPAS 24793
8 COAHUILA DE ZARAGOZA 21919
9 SONORA 21659
10 JALISCO 20595
11 SAN LUIS POTOSI 18284
12 BAJA CALIFORNIA 16987
13 SINALOA 16244
14 MICHOACAN DE OCAMPO 15253
15 YUCATAN 14923
16 GUERRERO 14893
17 OAXACA 13807
18 HIDALGO 10454
19 QUINTANA ROO 10364
20 CHIHUAHUA 7859
21 BAJA CALIFORNIA SUR 7777
22 DURANGO 6586
23 QUERETARO 6480
24 TLAXCALA 6479
25 CHIAPAS 6270
26 AGUASCALIENTES 5731
27 CAMPECHE 5592
28 ZACATECAS 5379
29 MORELOS 5234
30 NAYARIT 5037
31 COLIMA 3713

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-29 00:00:00 1 2
2 2020-02-06 00:00:00 1 3
3 2020-02-19 00:00:00 1 4
4 2020-02-21 00:00:00 1 5
5 2020-02-22 00:00:00 2 7
6 2020-02-23 00:00:00 1 8
7 2020-02-24 00:00:00 1 9
8 2020-02-25 00:00:00 1 10
9 2020-02-26 00:00:00 1 11
10 2020-02-27 00:00:00 2 13
11 2020-02-28 00:00:00 2 15
12 2020-02-29 00:00:00 2 17
13 2020-03-01 00:00:00 6 23
14 2020-03-02 00:00:00 8 31
15 2020-03-03 00:00:00 6 37
16 2020-03-04 00:00:00 7 44
17 2020-03-05 00:00:00 7 51
18 2020-03-06 00:00:00 10 61
19 2020-03-07 00:00:00 21 82
20 2020-03-08 00:00:00 21 103
21 2020-03-09 00:00:00 64 167
22 2020-03-10 00:00:00 50 217
23 2020-03-11 00:00:00 51 268
24 2020-03-12 00:00:00 60 328
25 2020-03-13 00:00:00 88 416
26 2020-03-14 00:00:00 91 507
27 2020-03-15 00:00:00 100 607
28 2020-03-16 00:00:00 133 740
29 2020-03-17 00:00:00 111 851
30 2020-03-18 00:00:00 123 974
31 2020-03-19 00:00:00 113 1087
32 2020-03-20 00:00:00 183 1270
33 2020-03-21 00:00:00 132 1402
34 2020-03-22 00:00:00 141 1543
35 2020-03-23 00:00:00 222 1765
36 2020-03-24 00:00:00 183 1948
37 2020-03-25 00:00:00 211 2159
38 2020-03-26 00:00:00 249 2408
39 2020-03-27 00:00:00 289 2697
40 2020-03-28 00:00:00 276 2973
41 2020-03-29 00:00:00 267 3240
42 2020-03-30 00:00:00 388 3628
43 2020-03-31 00:00:00 311 3939
44 2020-04-01 00:00:00 467 4406
45 2020-04-02 00:00:00 440 4846
46 2020-04-03 00:00:00 445 5291
47 2020-04-04 00:00:00 454 5745
48 2020-04-05 00:00:00 434 6179
49 2020-04-06 00:00:00 587 6766
50 2020-04-07 00:00:00 517 7283
51 2020-04-08 00:00:00 630 7913
52 2020-04-09 00:00:00 635 8548
53 2020-04-10 00:00:00 969 9517
54 2020-04-11 00:00:00 734 10251
55 2020-04-12 00:00:00 781 11032
56 2020-04-13 00:00:00 975 12007
57 2020-04-14 00:00:00 917 12924
58 2020-04-15 00:00:00 1057 13981
59 2020-04-16 00:00:00 1040 15021
60 2020-04-17 00:00:00 1186 16207
61 2020-04-18 00:00:00 1279 17486
62 2020-04-19 00:00:00 1154 18640
63 2020-04-20 00:00:00 1879 20519
64 2020-04-21 00:00:00 1235 21754
65 2020-04-22 00:00:00 1270 23024
66 2020-04-23 00:00:00 1323 24347
67 2020-04-24 00:00:00 1571 25918
68 2020-04-25 00:00:00 1632 27550
69 2020-04-26 00:00:00 1456 29006
70 2020-04-27 00:00:00 1784 30790
71 2020-04-28 00:00:00 1570 32360
72 2020-04-29 00:00:00 1418 33778
73 2020-04-30 00:00:00 1972 35750
74 2020-05-01 00:00:00 2673 38423
75 2020-05-02 00:00:00 1928 40351
76 2020-05-03 00:00:00 1831 42182
77 2020-05-04 00:00:00 2333 44515
78 2020-05-05 00:00:00 2351 46866
79 2020-05-06 00:00:00 2112 48978
80 2020-05-07 00:00:00 2352 51330
81 2020-05-08 00:00:00 2721 54051
82 2020-05-09 00:00:00 2418 56469
83 2020-05-10 00:00:00 3257 59726
84 2020-05-11 00:00:00 3015 62741
85 2020-05-12 00:00:00 2731 65472
86 2020-05-13 00:00:00 2664 68136
87 2020-05-14 00:00:00 2672 70808
88 2020-05-15 00:00:00 3950 74758
89 2020-05-16 00:00:00 3007 77765
90 2020-05-17 00:00:00 2875 80640
91 2020-05-18 00:00:00 4135 84775
92 2020-05-19 00:00:00 3230 88005
93 2020-05-20 00:00:00 4404 92409
94 2020-05-21 00:00:00 3051 95460
95 2020-05-22 00:00:00 3849 99309
96 2020-05-23 00:00:00 3554 102863
97 2020-05-24 00:00:00 3338 106201
98 2020-05-25 00:00:00 5024 111225
99 2020-05-26 00:00:00 3686 114911
100 2020-05-27 00:00:00 3516 118427
101 2020-05-28 00:00:00 4000 122427
102 2020-05-29 00:00:00 4068 126495
103 2020-05-30 00:00:00 3906 130401
104 2020-05-31 00:00:00 3645 134046
105 2020-06-01 00:00:00 6616 140662
106 2020-06-02 00:00:00 4143 144805
107 2020-06-03 00:00:00 4104 148909
108 2020-06-04 00:00:00 4251 153160
109 2020-06-05 00:00:00 5249 158409
110 2020-06-06 00:00:00 4939 163348
111 2020-06-07 00:00:00 4195 167543
112 2020-06-08 00:00:00 5582 173125
113 2020-06-09 00:00:00 4530 177655
114 2020-06-10 00:00:00 6082 183737
115 2020-06-11 00:00:00 4420 188157
116 2020-06-12 00:00:00 5161 193318
117 2020-06-13 00:00:00 4599 197917
118 2020-06-14 00:00:00 4464 202381
119 2020-06-15 00:00:00 6867 209248
120 2020-06-16 00:00:00 5165 214413
121 2020-06-17 00:00:00 4463 218876
122 2020-06-18 00:00:00 5457 224333
123 2020-06-19 00:00:00 5554 229887
124 2020-06-20 00:00:00 7178 237065
125 2020-06-21 00:00:00 4593 241658
126 2020-06-22 00:00:00 5857 247515
127 2020-06-23 00:00:00 5094 252609
128 2020-06-24 00:00:00 5034 257643
129 2020-06-25 00:00:00 6005 263648
130 2020-06-26 00:00:00 6497 270145
131 2020-06-27 00:00:00 5096 275241
132 2020-06-28 00:00:00 6085 281326
133 2020-06-29 00:00:00 6450 287776
134 2020-06-30 00:00:00 6397 294173
135 2020-07-01 00:00:00 8108 302281
136 2020-07-02 00:00:00 5937 308218
137 2020-07-03 00:00:00 6376 314594
138 2020-07-04 00:00:00 5589 320183
139 2020-07-05 00:00:00 6114 326297
140 2020-07-06 00:00:00 6787 333084
141 2020-07-07 00:00:00 6145 339229
142 2020-07-08 00:00:00 5642 344871
143 2020-07-09 00:00:00 5750 350621
144 2020-07-10 00:00:00 8744 359365
145 2020-07-11 00:00:00 5618 364983
146 2020-07-12 00:00:00 5938 370921
147 2020-07-13 00:00:00 7168 378089
148 2020-07-14 00:00:00 5978 384067
149 2020-07-15 00:00:00 7535 391602
150 2020-07-16 00:00:00 5977 397579
151 2020-07-17 00:00:00 6731 404310
152 2020-07-18 00:00:00 6688 410998
153 2020-07-19 00:00:00 5920 416918
154 2020-07-20 00:00:00 9238 426156
155 2020-07-21 00:00:00 5581 431737
156 2020-07-22 00:00:00 5550 437287
157 2020-07-23 00:00:00 5439 442726
158 2020-07-24 00:00:00 5918 448644
159 2020-07-25 00:00:00 6873 455517
160 2020-07-26 00:00:00 5191 460708
161 2020-07-27 00:00:00 6684 467392
162 2020-07-28 00:00:00 5526 472918
163 2020-07-29 00:00:00 4707 477625
164 2020-07-30 00:00:00 4861 482486
165 2020-07-31 00:00:00 5069 487555
166 2020-08-01 00:00:00 7444 494999
167 2020-08-02 00:00:00 4870 499869
168 2020-08-03 00:00:00 5819 505688
169 2020-08-04 00:00:00 4535 510223
170 2020-08-05 00:00:00 5211 515434
171 2020-08-06 00:00:00 4417 519851
172 2020-08-07 00:00:00 4918 524769
173 2020-08-08 00:00:00 5087 529856
174 2020-08-09 00:00:00 4181 534037
175 2020-08-10 00:00:00 6966 541003
176 2020-08-11 00:00:00 4390 545393
177 2020-08-12 00:00:00 4351 549744
178 2020-08-13 00:00:00 4269 554013
179 2020-08-14 00:00:00 4903 558916
180 2020-08-15 00:00:00 5243 564159
181 2020-08-16 00:00:00 4103 568262
182 2020-08-17 00:00:00 4912 573174
183 2020-08-18 00:00:00 4777 577951
184 2020-08-19 00:00:00 3905 581856
185 2020-08-20 00:00:00 5383 587239
186 2020-08-21 00:00:00 3842 591081
187 2020-08-22 00:00:00 3400 594481
188 2020-08-23 00:00:00 2936 597417
189 2020-08-24 00:00:00 3119 600536
190 2020-08-25 00:00:00 2344 602880
191 2020-08-26 00:00:00 1595 604475
192 2020-08-27 00:00:00 908 605383
193 2020-08-28 00:00:00 384 605767
194 2020-08-29 00:00:00 173 605940
195 2020-08-30 00:00:00 77 606017
196 2020-08-31 00:00:00 19 606036

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
359471 2020-09-01 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
625299 2020-09-01 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI
1255242 2020-09-01 009132 1 IMSS 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-07-29 2020-07-29 2020-06-29 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 224118
1 AMBULATORIA MUJER 228203
2 HOSPITALIZADO HOMBRE 93741
3 HOSPITALIZADO MUJER 59974

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Casos Por día

Una manera de poder ver el número de casos nuevos por dia es usando un heatmap en que podemos ver el crecimiento de casos por cada 100K personas del Estado. Para poder apreciar mejor el número de casos se calcula el logaritmo base 10. La idea original de esta visualización la puedes encontrar en el siguente artículo:

https://towardsdatascience.com/visualization-of-covid-19-new-cases-over-time-in-python-8c6ac4620c88

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.